Los modelos de razonamiento cuantizados creen que necesitan pensar más, pero no
La cuantización agresiva reduce la precisión y alarga el razonamiento de los modelos de IA. Descubre cómo una penalización simple en tokens de 'overthinking' mejora la eficiencia.